报道丨CCFTF04:问答、机器翻译、无人驾驶、人脸识别行业的人工智能应用现状和进展

阅读量:299

CCF TF(技术前线委员会,Tech Frontier Committee)是中国计算机学会为企业界计算机专业人士创建的企业间常态化合作交流平台,CCF TF创始委员由Intel、LinkedIn、Microsoft、爱奇艺、百度、滴滴、方正、瓜子、华为、京东、链家网、联想、蚂蚁金服、美团点评、摩拜、奇虎360、搜狗、曙光、腾讯、网易、微博、小米、携程、新浪、中兴等25家知名企业的技术团队负责人(CTO、技术副总或研究院院长)担任。另外还组建了架构、安全、前端、系统与运维、大数据、智能交互、工程文化与职业发展、算法与人工智能、游戏核心技术等9个SIG(Special Interest Group)。CCF TF将以SIG为主体举行丰富的交流活动。

CCFTF的第四期技术前沿研讨会,于12月10日在京举行,来自网易、微软、主线科技、百度等一线的具备十年左右或者更长创业经验非常资深的技术大咖们,基于具体的开发和技术应用,做了非常干货的分享。


杜子德

CCF秘书长:杜子德


周枫

会议主席、网易高级副总裁、网易有道CEO  周枫


本次会议主席由CCFTF的算法与人工智能SIG主席、网易高级副总裁、网易有道CEO周枫担任。CCF秘书长杜子德做开场致辞,阐述了CCF发起这个TF技术前沿研讨会的初衷和愿景之后,周枫接过了话筒接着谈到,和十多年前他上清华大学学习当年的冷门人工智能很不同的是,今天的工业界对人工智能的应用已经非常广泛,CCF TF就是要把这类学术问题在工业界和企业界的应用,创造一个产业和学界沟通的平台做深入的交流,从而深入促进整个行业的高速健康发展。


段楠

微软亚洲研究院自然语言计算组主管研究员  段楠

接着报告顺序展开。首先是微软亚洲研究院自然语音计算组的研究员段楠的报告。段楠系统介绍了信息机器人(Informational Bot, InfoBot)背后的问题理解、答案匹配和问题生成技术,具体为四部分:第一部分,简要回顾自动问答研究的任务定义、发展历史和代表产品;第二部分,简要介绍和自动问答研究相关的深度学习基础知识;第三部分,详细介绍基于知识图谱、表格和文本的自动问答技术;第四部分,概要介绍最新的基于生成模型的问题自动生成技术。


段楠平时研究的课题方向主要就是智能问答,以及智能问答在一些人工智能产品里面应用,按照上述的框架,他分享了在微软的智能搜索,一些像小冰这样的智能对话机器人中,针对一些场景的非常具体的应用。


张天雷

北京主线科技创始人  张天雷


接着是第二个报告,北京主线科技创始人张天雷。


会议主席周枫介绍说:主线科技的创始人张天雷,还有一个身份,是知乎上回答自动驾驶问题的大V,网名叫小猴机器人。天雷是自动驾驶领域非常资深的技术专家,曾经在百度研究院余凯团队一起做了3年无人车。百度第一个在北京五环上绕了一圈的那个车,是张天雷他们团队做的,所以他是咱们国家能够把车真的开上路的,通过自动驾驶方式开上路的几个团队之一。


张天雷的演讲主题是:无人驾驶从原型到落地。张天雷2014年加入百度,在百度工作了将近三年到2017年初的时候又发现了一个痛点,就是目前无人驾驶或者智能驾驶这个技术在乘用车上面落地应用还为时尚早。全世界范围内,包括谷歌做了大概有八九年时间,也仅仅是刚刚开始在某些地方进行了局部的示范,而且它的规模也就是几十辆,所以张天雷觉得在乘用车上做智能驾驶落地还是不够快,因此拉着之前几个伙伴聚在一起创业做了这个主线科技。主线科技现在主要聚焦在商用车,尤其是智能卡车的自动化上面。张天雷的分享从智能驾驶产品分类谈起,剖析不同分类的优缺点,最后给出主线团队选择专用车作为落地产品的思考。


张天雷认为智能驾驶或者说智能网联汽车这件事情是一个绝佳的人工智能未来落地的点。普通人开车,其实就是在做三件事,第一件事就是通过“我”所谓的传感器,“我”的眼睛耳朵感受周围环境,得到了周围环境信息,会做一些预处理,把周围这些东西转换成语义,之后就会做下一步的决策,这个决策就包括是要继续跟车、换道还是去加减速等等一些语义,这就是第二部分,就是决策的部分。然后“我”做完决策之后,不能空想,必须有这样一个执行,实际上第三部分就是我们规划之后的行动,而这里面我们刚才谈到这三个层次,涉及到了非常非常多的我们计算机专业的子学科,计算机本身和子学科之间交叉的很多的技术的演进,所以说现在智能驾驶这件事情是一个绝佳的人工智能应用落地的场景。


在创业实践中,张天雷发现“做决策”这个部分是人工智能的坚果核。虽然新闻中炒作了很多深圳的公交车已经上路了,司机这个岗位可以再见了等等的话题,一方面大家又很诧异,为什么在路上没见到一辆无人驾驶的车?张天雷认为主要原因就是因为现在的人工智能的决策能力还没有完全在智能驾驶汽车上体现出来。这就涉及到人工智能的决策模型里所有关键技术,就是你怎么去表征你所学过的这些东西。你怎么样去建一个模然后去学,你的学习过程是什么,最后你怎么去验证,所有这些问题目前来讲都没有很好的解决。


张天雷创业的公司主线科技已经做了很多的工作,具体关于主线科技的详细故事,请点击今天被无人驾驶朋友圈内人士广为转发的文章:一家创业公司,或抢在百度谷歌之前落地无人驾驶商业化


黄瑾1(1)

网易有道高级技术专家  黄瑾


接着是网易有道黄瑾的报告,对于自己公司深耕的领域,会议主席周枫介绍说:翻译其实是一个非常古老的领域,1950年左右就已经开始有机器翻译系统,但是一直效果非常不好。这两年有很大的变化,有道翻译翻了十九大的报告,比我自己翻的好多了(小编注:周枫是毕业于UCLA的博士)。目前的实际情况是,机器翻译在中文到英文的领域可以超越普通人,因为中国人遣词造句写英文,看过的好文章肯定没有机器见的那么多,反过来,主要语言英文到中文的翻译(有道)也是可以做得相当不错的。


黄瑾的报告主题是:人工智能技术在我们产品有道翻译官上的应用。主要介绍了有道翻译官在机器翻译、OCR场景下的应用实践,分为如下四个部分:基于神经网络的机器翻译技术综述;基于神经网络的文字识别技术综述;拍照翻译场景下OCR与机器翻译功能的体验改进;离线场景下OCR与机器翻译功能的探索。


刘经拓

百度资深研发工程师  刘经拓


来自百度的刘经拓的报告主题是:基于深度学习的人脸技术与应用。与大家一起回顾了深度学习出现以来人脸技术的发展的情况,以及百度在人脸技术和行业应用中的探索和实践,主要分为以下几个部分:1.人脸技术及其子方向简介;2.基于深度学习的人脸技术原理;3.人脸识别系统及应用实践;4.未来发展趋势及研究方向。其中第二部分挑了两个比较重要方向做了比较详细的技术细节分享,一个是说训练数据怎么选,另外就是网络结构怎么设计,就是优化目标,到底这个框怎么表示,另外就是在预测加速上这个事情要怎么做。


panel

论坛Panel环节


报告结束后的Panel环节是周枫主持,四位讲者一起参与。第一个问题是,机器和人的关系问题,即机器是不是会代替人。大家的观点基本相近,张天雷说现在很多工作岗位上,不是说换不换人的问题,而是找不到人来干的问题。因为我国人口红利已经结束,目前产业界面临的问题是一个是人手不够,另外一个是具体的人不愿意干某类具体的事。


周枫抛出的第二个问题是,干人工智能,是否一定需要科班出身?从大家实际团队经验来看,如果是科班出身,会是什么情况,如果不是,但是又想参与这个领域怎么办?


毕业于清华电子系的百度的刘经拓说自己就不是科班出身,他的观点是:如果你希望是成为一个学术领导者,在学术圈呼风唤雨,可能科班出身还是更有优势,如果想把这个东西做成应用,能力在实际产品有价值,这件事情可能科班出身就没有那么重要。现在我的团队里面,大概一半一半,有一半科班出身,有一半不是。和刘经拓同年的清华计算机系毕业的张天雷说:想从事这个行业,不需要你是科班出身的,根本原因是,你并没有办法定义人工智能科班到底是什么。


周枫的第三个问题是:在未来一年时间之内,你们觉得你们所在领域可能取得的最大的突破或者说最大的进展会是什么,或者说你们觉得可能值得在什么地方努力?

百度的刘经拓认为:在各种条件不好的情况下,也能把一个对象像人一样把它认出来,这件事情其实现在机器还做不太好,是一个值得啃的硬骨头。


网易有道的黄瑾从个人角度觉得,未来一年首先最期待的是神经网络机器翻译可解释性和可控性变强,另一个期待是能够看到机器翻译在个人应用基础上有更多的商业应用落地,怎么样让这个技术更好用,从而帮到一些人或者一些企业节省成本提高效率,这是特别有趣和有价值的事情。

读完这篇文章后,您心情如何?